TESTES DE HIPÓTESES 
ENVOLVENDO O ESTUDO DOS 


TESTES: NORMAL, “T” DE STUDENT 
E QUI-QUADRADO 


META 

Estudar e interpretar afirmações feitas sobre parâmetros populacionais, 
bem como em relação à igualdade entre dois parâmetros. No caso do 
teste não-paramétrico avaliar o comportamento entre frequências 
observadas e as esperadas por uma variável ou a independência entre 
duas variáveis. 


OBJETIVOS 

Ao final desta aula, o estudante deverá: 

Realizar testes envolvendo parâmetros e proporções. 

Realizar teste não-paramétrico envolvendo uma variável e teste de 
contingência. 


PRÉ-REQUISITO: 


Conhecimentos sobre estatística descritiva, probabilidades e amostragem. 


Também são importantes: Papel, Calculadora ou Computador para 
realização dos cálculos. 
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INTRODUÇÃO 


Olá! Tudo bem? Vamos dar sequência ao nosso estudo da inferência 
estatística, iniciada com a amostragem, com o objetivo agora de verificar se 
determinada afirmação sobre um parâmetro populacional é verdadeira ou 
não, bem como a que envolve a análise de dois parâmetros amostrais. No 
caso dos testes para proporções os dados da amostra se apresentam em 
termos de contagens ao invés de medidas como acontece com os testes de 
parâmetros, no mais suas aplicações são bastante semelhantes. 

No estudo da amostragem mostramos que as estatísticas da amos- 
tra como médias e proporções são estimativas pontuais dos correspon- 
dentes parâmetros populacionais. Vimos também que as estatísticas da 
amostra tendem a aproximar, ao invés da hipótese de que são iguais aos 
parâmetros populacionais. 

Neste contexto de estimativas de parâmetros populacionais a partir 
dos parâmetros amostrais é que estão fundamentados os conceitos dos 
testes de parâmetros, cujo objetivo é investigar se a diferença entre 
parâmetros da amostra e da população ou entre dois parâmetros de amos- 
tras pode ser atribuída à variabilidade amostral ou se a discrepância é 
demasiado grande ao ponto de se tornar significativa, de acordo com o 
nível de significância estabelecido para o teste. Estes testes também 
podem ser aplicados a partir de uma teoria preconcebida relativa à ca- 
racterística da população submetida a estudo, tanto para parâmetros 
como para proporções. 

Finalizando o estudo dos testes mencionados nesta aula você vai tra- 
balhar com o Qui-Quadrado que é um teste não-paramétrico, também 
muito utilizado na área biológica e de saúde. Quando se trabalha apenas 
com uma variável este teste vai investigar a existência ou não de diferen- 
ça significativa entre suas frequência, no caso de duas variáveis ele procu- 
ra a existência de alguma dependência entre elas. 


Testes de hipóteses envolvendo o estudo dos testes... 


CONSIDERAÇÕES GERAIS SOBRE TESTES DE 
HIPÓTESES 


Quando investigamos uma população por intermédio de uma amos- 
tra, o principal objetivo é tirar concluões sobre os principais parâmetros 
desta população, com uma probabilidade bastante significativa de acerto. 

Um procedimento valioso de avaliação deste tipo de estudo, é o teste 
de hipótese, que procura investigar se os dados da amostra estão coeren- 
tes com os da população, ou se duas ou mais amostras possuem parâmetros 
equivalentes, levando em conta para ambas as situações o nível de 
significância do teste que no máximo pode ser igual a 10%, sendo os mais 
utilizados os de 5% e 1%. 

Uma média aritmética de amostra observada se qualifica como um 
resultado comum se a diferença entre seu valor e o da média aritmética da 
hipótese da população for pequena. 

O nível de significância (01) de um teste representa a probabilida- 
de máxima de se cometer o erro tipo 1, isto é: de rejeitar HO quando 
esta é verdadeira. 


HIPÓTESES DO TESTE 


Hipótese Nula: HO - Esta hipótese só deve ser rejeitada quando 
possíveis deferenças entre parâmetros da amostra e da população 
investigada, ou entre parâmetros amostais for grande ao ponto de se tor- 
nar significativa, com base no nível de significância estabelecido para o 
teste. 

A hipótese nula trabalha com a idéia de que as possíveis diferenças 
entre os parâmetros da população e da mostra é devida apenas ao acaso, 
ou seja, a erros de amostragem, isto é: essa diferença não é significativa. 

A decisão de manter HO (hipótese submetida ao teste) representa 
apenas uma boa probalidade de que esta hipótese seja verdadeira. A mes- 
ma segurança probabilística teremos no caso de rejeição desta hipótese. 
Uma vez que a maior parte dos pesquisadores espera rejeitar HO em 
favor de H1, a fragilidade relativa a decisão de manter a hipótese nula 
geralmente não representa um problema sério. 

Se a hipótese nula for verdadeira, a distribuição de todas as médias 
amostrais estará centrada em torno da média da população investigada. 
Este conjuinto representa a distribuição da hipótese nula. 

Como a média aritmética da amostra é um estimador não viésado da 
média aritmética da população investigada, o valor médio de todas as 
médias amostrais (distribuição de amostragem) é sempre igual a média 
aritmética da população (Teoria do limite Central). 
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TIPOS DE ERROS QUE PODEM SER COMETIDOS 
NA AVALIAÇÃO DA HIPÓTESE NULA 


Quando utilizamos o parâmetro de uma amostra para tomada de de- 
cisões sobre o parâmetro da população, poderemos tomar alguma decisão 
errada em relação a hipótese a ser testada, que é refletida por um destes 
tipos de erros: 


Erro tipo 1 - Rejeitar HO quando esta hipótese é verdadeira (alarme 
falso - resultado comum) 

Erro tipo II - Aceitar HO quando esta hipótese é falsa (falha de inves- 
tigação - resultado raro) 


Decisão sobre HO HO verdadeira HO falsa 


Erro tipo II 
Erro po” 


Coeficiente de confiança - é o complemento (1 - () da probabilidade do 
erro tipo I, este coeficiente geralmente é conhecido por nível de confian- 
ça. Ele representa a probabilidade de que a hipótese nula não seja rejeita- 
da quando de fato for verdadeira. 

A probabilidade de se cometer o erro tipo II (risco 83), também conhe- 

cido com o nível de risco depende da diferença entre o valor da hipótese 
e os verdadeiros valores dos parâmetros da população. Grande diferença 
entre os parâmetros da amostra e da população implica numa pequena 
probabilidade de se cometer o erro tipo II. 
Eficácia de um Teste - identificado por (1 - 8), é a probabilidade de se 
rejeitar a hipótese nula quando ela é falsa. Uma forma de reduzir a probabi- 
lidade de se cometer o erro tipo II é aumentar com coerência o tamanho da 
amostra, para termos mais argumentos nas investigações de diferenças, 
mesmo pequenas, entre parâmetros da amostra e população. Porém é preci- 
so cuidado na ampliação do tamanho da amostra para não mascarar o valor 
da estatística calculado para o teste, a ser comparada com a região crítica 
oriunda do nível de significância estabelecido. 


Quanto maior o tamanho da amostra, maior a representatividade da 
mesma, portanto, maior será o poder do teste, isto é: maior será a proba- 
bilidade de rejeitarmos HO falso. 

O Poder de um Teste é tão forte quando mais próximo estiver de um 
(1), neste situação a probabilidade de se rejeitar uma hipótese nula fal- 
sa é bastante alta. 


Testes de hipóteses envolvendo o estudo dos testes... 


TESTE UNILATERAL OU BILATERAL: 
QUANDO APLICAR? 


A seleção da área para avaliação da hipótese nula depende do objeti- 
vo da investigação: 
Os Testes Unilaterais são indicados quando se deseja investigar deter- 
minada característica da população em relação a um único sentido 
(extrapolação de um padrão máximo ou mínimo), como por exemplo: teor 
mínimo ou máximo de gordura no leite, resistência máxima de correias à 
tensão, vida útil de produtos, radiação emitida por usinas nucleares, po- 
luição atmosférica, etc. 
Os Testes Bilaterais são indicados sempre que a divergência crítica é 
em ambas as direções, como por exemplo: fabricação de roupas, fabrica- 
ção de peças conjugadas (porca e parafuso), etc. Geralmente este modelo 
é o mais utilizado. Também deve ser utilizado quando se investiga se 
duas amostras estudadas em relação à determinada característica, foram 
adequadamente estraidas de um mesmo universo. 


TESTES NÍVEL DE SIGNIFICÂNCIA (+ ; 5) 


Bilateral - zt(4/2) 


TESTE NORMAL (z) - QUANDO APLICAR? 


Quando se investiga a dimensão da distância na qual a média arit- 
mética da amostra se desvia, em unidades de erro-padrão, da média da 
população (teste “z” para a médiada população). 


66,,79 


O teste “z” é considerado preciso quando: 


A população é normalmente distribuída, ou o tamanho da amostra é 
suficientemente grande, de maneira que satisfaça o teorema do limite central. 
O desvio-padrão da população deve ser conhecido. Neste caso com 
base no teorema do limite central, a distribuição de amostragem da média 
aritmética seguiria a distribuição normal. 
6,2» 


A estatística “z” representa quantos desvios padrões o parâmetro 
amostral está distante do parâmetro populacional. 


Razão de “z” para uma única amostra: 


zc=(x-o/x e ze=(p-p)/V(p*q)/n 
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População investigada (N); tamanho da amostra (n); média 
populacional (y); média amostral (x) 

Erro-padrão da média amostral (sx) “p => proporção da caracterís- 
tica investigada na amostra => 'p+'q = 1. 


p => proporção da característica na população investigada. 
“ze” para diferença entre duas médias amostrais. 
zc=(E|-*2)/V (s/nl + s/n2) 


“zc” para diferença entre duas proporções amostrais. 

ze = (pl -p2) /V (pl *“ql)/nl+ (p2 * “92)/n2) 

No caso do teste “z” aplicado a uma proporção, devemos trabalhar 
com uma amostra suficientemente grande (isto é: np 2 5), para que a 
distribuição normal ofereça uma boa aproximação para os dados de uma 
distribuição binomial. 


Ex: Uma população de 700 bovinos com peso médio 275 kg e des- 
vio-padrão de 50 kg, foi investigada a partir de uma amostra de 100 bovi- 
nos com média amostrar de 290 kg. 

A hipótese a ser investigada de é de que nada aconteceu com relação 
a média da população, isto é: u = 275 (hipótese nula), embora os pesqui- 
sadores suspeitem exatamente o oposto, ou seja alguma alteração signifi- 
cativa deve ter acontecido com média da população de bovinos (hipótese 
alternativa). Isto é: existe uma expectativa de rejeitar a “hipótese nula”. 

Observação: se a hipótese nula for verdadeira, as distribuições de 
todas as médias amostram estará centrada em torno da média da popula- 
ção (275). Este conjunto representa distribuição da hipótese nula. 


O erro-padrão da média aritmética (O x) é obtido pela fórmula: 
0ox=0//n - Paraestaamostra 0Xx=0/vVn=50//100=5. 


Este erro-padrão reflete o afastamento entre as médias das amostras. 
Hipóteses: Hipótese nula: u = 275 e Hipótese alternativa: u É 275 


Razão de “z”” para uma única amostra: Zc=(X-L/OX paranosso 
exemplo: ze = 3,00 

Conclusão: como ze = 3,00 a hipótese nula é rejeitada para os níveis de 
significância de 10%, 5% e 1%. 

Teorema do Limite Central - Consideremos uma população que tem 
como parâmetros: média = u e desvio padrão = O - da qual estaremos 


66,7) 


aleatoriamente uma amostra “n”, este teorema estabelece o seguinte: 


Testes de hipóteses envolvendo o estudo dos testes... Aula 


Se a população tiver distribuição normal, a média amostral terá dis- 
tribuição normal (u; O// n); isto é: a média das médias de todas as 
possíveis amostras será igual à média da população, e o desvio-padrão 
das médias de todas as possíveis amostras será uma fração do desvio-padrão 
da população, fração tanto menor quanto maior for o tamanho da amostra. 

Observação: mesmo que a população não possua distribuição nor- 
mal, a média amostral pode ser considerada normal, desde que o tama- 
nho da amostra seja suficiente grande, em geral para n 230. 

À partir deste teorema, podemos obter resultados para a média amostral 
conhecendo apenas os parâmetros da população (média - u ; desvio- 
padrão - O) 


Exemplo: Consideremos a população de preços de gasolina, com média 
1,437 e desvio-padrão 0,093. 

Extraindo-se uma amostra de 36 preços, qual a probabilidade da média 
amostram diferir menos de 2 centavos, para cima ou pata baixo, da média 
da população? 

O teorema do limite central nos diz que a média amostram é normal- 
mente distribuída e tem os seguintes parâmetros: 


Média da amostra 1,437 

Desvio-padrão da amostra 0,093; n= 36 

Erro Padrão da Média Amosttral = 0,0155 

(Erro Padrão) * N. Confiança (1) = 0,02 (afastamento) 

Intervalo de Confiança para a média populacional 

L. Inferior — 1,417 L. Superior = 1,457 

Probabilidade do preço pertencer a este Intervalo 

Erro Padrão = 0,02 / 0,0155 = 1,29 

Isto é: 1 menos a prob (2 <-1,29 ez > 1,29) = 2*0,4015 = 80,3% 
P(1,417 < u< 1,457) = 1-0,1970 = 0,8030 
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Como estimar o valor “p” em Testes da Distribuição Normal 
O valor “p” é a probabilidade de se obter uma estatística de teste 
maior ou igual que o resultado obtido a partir dos dados da amostra, des- 
de que a hipótese nula seja realmente verdadeira. 
66,7) 


O valor “p” é frequentemente chamado de “nível observado de 
significancia”, isto é o menor nível no qual a hipótese nula pode ser rejeitada. 
b) 


Se: p > (a hipótese nula é aceita. 

Se: p & «1 a hipótese nula é rejeitada 

Teste Bilateral: Quando a média da amostra é maior ou igual a média 
populacional p = 2* P(z 2 20). 
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Quando a média da amostra é menor ou igual a média populacional 
p=2* P(z <zc). 


Exemplo: Afirma-se que a média de uma população é 200. Uma amostra 
aleatória retirada dessa população com 36 unidades, tem média 208 e 
desvio padrão 35. Verificar se devemos aceitar a hipótese nula ao nível 
de 5%. 

Resolução: ze = 1,37. Como a média amostra é maior do que a mé- 
dia populacional => p=2*P(z 21,37), 


portanto: p = 2*0,0853 = 0,1706. Como 0,1706 é maior que 0,05 
aceitamos a Hipótese Nula. 


Exemplo: Uma empresa que produz determinado cereal, afirma que o 
peso médio da caixa deste cereal é de 368 gramas com desvio-padrão de 
15 gramas. Uma amostra aleatória de 25 caixas foi selecionada obtendo 
média de 363,5 gramas. Aplicar o teste conviniente. Observação: consi- 
dere o desvio padrão da amostra aproximadamente igual ao da popula- 
ção. Nível de significância de 5%. 


Utilizando um teste bilateral: HO: y = 368 e Hi: uZ368 


O valor de “z” calculado para a pesquisa (ze = - 1,50) deve ser 
comparado com o intervalo de +1,96. 


Resolução: Como a média amostra é menor do que a média 
populacional => p= 2*P(z <- 1,50), portanto 


p = 2*0,0668 = 0,1336. Como 0,1336 é maior que 0,05 
aceitamos a Hipótese Nula. 


Teste Unilateral: quando a média da amostra é maior ou igual a média 
populacional p = P(z 2 20). 


Quando a média da amostra é menor ou igual a média populacional 
p= P(z <zc). 
Exemplo: Utilizar teste unilateral na questão anterior: 
HO: u=368 e Hi: u> 368 

À região de rejeição neste caso esá relacionada com a cauda inferior 
da distribuição da amostra. À área de aceitação da hipótese nula é 0,95, 
enquanto a de rejeição desta hipótese é de: 0,05 (1 = 5% ), com probabi- 
lidade de 1,65. 

Resolução: Como a média da amostra é menor do que a média 
populacional => p = P(z<- 1,50) = 0,0668 


Testes de hipóteses envolvendo o estudo dos testes... 


Como 0,0668 é maior que 0,05 aceitamos a Hipótese Nula. 


TESTE NORMAL ENVOLVENDO UMA MÉDIA 


A tabela seguinte registra uma amostra aleatória retirada de uma po- 
pulação com distribuição normal. 

Afirma-se que a média da população é 31,3. Verificar se esta afirmação 
deve ser aceita no nível de significância de 5%. Utilizar teste bilateral. 


A 


AMOSTRA VARIÂNCIA 


Amostra (n) = 36 
1,6684 2,3767 
0,2101 0,1406 
n-1=35 
1,4601 0,0434 
35 0,0851 0,3906 
N. Significância 
1,0851 2,6406 (5%) zt = 1,96 
00156 | 246406 | média população 
31,30 
25 28 1,8906 0,7656 


Média amostral 


33 30 
24267 | 55156 525 
Variância amostral 
32 30 0,0434 0,2934 38,0764 
J7 5,8991 0,3906 Desvio-Padrão 
6,1706 
27 1,2656 1,0851 
38 0,0434 0,6267 Erro Padrão 
26 1,4601 1,4601 1,0284 
38 2,1267 
52 2,9184 0,0434 
Elaboração do teste 1,896 


4 
36 


24 
31 
26 32 
37 
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Conclusão: Aceita HO, isto é, a média da população é 31,3. 


66,7) 


Também confirmada pelo valor de “p 


p > 1 ahipótesenula é aceita. p<m ahipótese nula é rejeitada 


zc= 1,89 => Área Normal de zc = 0,4706 
Valor de “p” p= 2+*(0,5 - área de zc) = 2* (0,5-0,4706) = 0,059 => Aceita HO 
Estimativa da Média Populacional P ftx-zs <u<kx+tzsj=1-a 


1294 pI => Média pertence ao Intervalo 


TESTE NORMAL ENVOLVENDO DUAS MÉDIAS 


Uma indústria fabrica dois tipos de pneus. Numa pista de testes, os 
desvios padrões das distâncias percorridas, para produzir um certo des- 
gaste, são 2.500 km e 3.000 km. Para se testar a hipótese de igualdade da 
média de duração entre os dois tipos de pneus, tomou-se uma amostra de 
50 pneus do primeiro tipo e 40 dp segundo, obtendo-se médias de 24.000 
km e 26.000 km respectivamente. Efetuar o teste, para um nível de 
significância de 5%. 


Hipóteses => HO: u,-=u, Hu ZU, 


“ce” para diferença entre duas médias amostrais. 
— (e fa2 2 
zc=(R-2)/V (s/n, + s/n) 


Excel: zc= (E38 - E39) / (Raiz((B38º2/C38) + (B39º2/C39)) 


TESTE NORMAL ENVOLVENDO 
UMA PROPORÇÃO 


Um jogador de bola ao cesto tem sucesso em 60% dos seus arremes- 
sos a meia distância. Em um treino de 100 arremessos ele acertou 70. E 
possível aceitar a hipótese de que está melhorando a pontaria. 


Testes de hipóteses envolvendo o estudo dos testes... Aula 


Utilizar um nível de significância de 5%, isto é: zt= 1,65 
p = 0,60 q = 0,40 n=100 “p=0,70 


HO:p=0,60 e Hi:p>0,60 
ze=(Pp-p)/vV (p*q)/n =204 => Rejeita HO 


Proporção da amostra menor do que a proporção populacional 


p= P(z < 20). 
p= p(0,5 - 0,4793)= 0,021 Conclusão: p < 0,05 => Rejeita HO. 


TESTE NORMAL ENVOLVENDO 
DUAS PROPORÇÃO 


Em uma pesquisa de opinião, 32 dentre 80 homens declararam apre- 
ciar certa revista, acontecendo o mesmo com 26 dentre 50 mulheres. Ao 
nível de 5% de significância, os homens e as mulheres apreciam igual- 
mente a revista. 


Hipóteses => p =p /pfp 
p=04  “q=0,60 n=80 

p=052  q=0,48 n=50 

ze = (Pl - P2) / V (pl *qU)/ni+ (p2 + “q2)/02) = (1,34) 
Como zt = 1,96, Conclusão; Aceita HO 

zc = (B53 - B54) / Raiz((B53*D53/E53)+(B54*D54/E54)) 


O mesmo resultado é obtido, calculando a média ponderada das amostras 


pata Pp. (1,34) 


p=(ni*pi+n2p)/(nl+n2) Pp=0,45 “q=0,55 


Em uma pesquisa sobre possuidores de videocassete, encontram-se 
120 das 200 casas pesquisadas no bairro Oliveira e 240 das 500 residências 
no bairro Calheiros. Há diferença significativa entre a proporção de possui- 
dores de vídeo nos dois bairros? Use nível de significância de 5%. 
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Hipóteses => HO: pl = p2 Hpl=p2 zt = 1,96 
p1=0,60 “ql =õ0,40 n= 200 
p2=0,48 “q2 = 0,52 n=S00 

zc=(pi-Pp)/J ((pl*ql/nl+ (p2*“q2)/n2) 2,91 => Rejeita HO 

ze = (B53 - B54) / Raiz((B53*D53/E53)+(B54*D54/E54)) 
TESTE “” 


Seja testando hipóteses ou constrindo intervalo de confiança para 
médias aritméticas de populações, utilize “t” em vez de “z” sempre que, 
como na maioria das vezes acontece, o desvio padrão da população for 
desconhecido. Nestes casos usamos os valores críticos da distribuição 
“” com “n - 1? graus de liberdade em lugar dos valores normais. 

Graus de liberdade - se referem ao número de valores que são 
livres para variar. À perda de 1 grau de liberdade ocorre, quando o desvio- 
padrão da amostra é utilizado para estimar o desvio padrão desconhecido 
da população. Ex: seja uma amostra formada por: 40 - 44 - 46 - 41 - 
43 e 44. Considerando quaisquer dos cinco desvios o desvio que sobra 
não é livre para variar: este valor deve se submeter a restrição de que a 
soma de todos os desvios em relação a média aritmética é igual a zero. 
Neste caso se escolhermos os cinco primeiros desvios, o desvio remanes- 
cente deve ser igual a 1 e, consequentemente a observação remanescente 
a 6* deve ser igual a 44. Da mesma maneira considerando os cinco últi- 
mos desvios o desvio remanescente é igual a -3 e, a primeira observação 
deve ser igual a 40. 

Quando utilizamos “+ 
investigada pela amostra deve ser normalmente distribuída. Porém mes- 


2 


é bom não esquecermos que a população 


> 


mo que a premissa da normalidade seja violada, “t” mantém grande 
parte de exatidão desde que o tamanho da amostra não seja demasiada- 
mente pequeno (n 2 15). 

Os processos “t? são bastantes robustos contra a não-normalidade da 
população quando não há pontos discrepantes (outliers - fora do padrão da 
pesquisa), em especial quando a distribuição é aproximadamente simétrica. 

Ex: Numa pesquisa de indivíduos sobre resistência física se uma delas 
está aquém de suas potencialidades normais, com certeza vai aparecer um 
resultado bastante fora do padrão esperado. É uma informação que deve 
ser analisada com muito cuidado, para uma tomada de decisão correta, vis- 
to que é preciso ter muita segurança na eliminação de um valor outliers. 

Se uma amostra demasiadamente pequena (em torno de 10) sugere 
que é procedente de uma população não normal - possivelmente em ra- 


Testes de hipóteses envolvendo o estudo dos testes... 


zão de uma assimetria relevante entre as observações da amostra - seria 
prudente aumentar o tamanho da amostra antes de testar hipóteses ou 
construir intervalos de confiança. 

Quase sempre o desvio padrão da população é desconhecido e deve 
ser estimado a partir da amostra. Assim sendo a substituição do erro- 
padrão da média aritmética O/ fon - por sua estimativa s/ /n, tem 
um importante efeito sobre todo o teste de hipótese para a média aritmé- 
tica de uma população. 


Como estimar o valor de “p” em teste para distribuição “t” 

O valor “p” é a probabilidade de se obter uma estatística de teste 
maior ou igual que o resultado obtido a partir dos dados da amostra, des- 
de que a hipótese nula seja realmente verdadeira. 

O valor “p” é frequentemente chamado de “nível observado de 
significância”, isto é o menor nível no qual a hipótese nula pode ser 
rejeitada. 

Se: p> m a hipótese nula é aceita. Se: p< m ahipótesenula 
é rejeitada 


Teste Bilateral: Quando a média da amostra é maior ou igual a média 
populacional p = 2*P(t > tc). 


Quando a média da amostra é menor ou igual a média populacional 
p= 2*P(t< tc). 


Teste Unilateral: quando a média da amostra é maior ou igual a média 
populacional p= P(t 2 tc). 


Quando a média da amostra é menor ou igual a média populacional 
p= P(t<to). 


TESTE “t PARA UMA AMOSTRA 


Quando utilizamos o teste “t” para uma amostra, pressupomos que 
as informações pesquisadas são extraídas independentimente e represen- 
tam uma amostra aleatória de uma população normalmente distribuída. 
Embora o teste “ 
de da população, deveremos estar atentos para populações pequenas 
(n < 30). Para as amostras pequenas, ficando comprovado a ausência de 


normalidade dos dados, outros testes podem ser mais eficientes. 


t” seja robusto, principalmente em relação a normalida- 


c=(T-n)/6/Vo) gd=0-1) 
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Hipóteses do teste para uma amostra. 


A hipótese nula trabalha com a premissa de que não há diferença 
significativa entre a média amostral e a média populacional, isto é: 

HO: u == 

À hipótese alternativa nega esta premissa, isto é: 

Hit u SE comu Hi uu >= 


INTERVALOS DE CONFIANÇA “t ” 
PARA UMA AMOSTRA 


Dispondo do cálculo dos principais parâmetros desta amostra, pode- 
remos calcular, de acordo com determinado nível de confiança, um inter- 
valo de valores para estimativa da média populacional. 

nu == + t*s/vn. Esse intervalo é exato quando a distribuiçao da 
população é normal, sendo aproximadamente correto em outros casos 
quando “n” é grande. 

À interpretação que deve ser dada a este intervalo de confiança é a 
mesma para a distribuição “z”. Isto é: um NC = 95%, implica que 95% 
de todos os intervalos de confiança projetados para esta população, in- 
cluirão a média aritmética desconhecida (w. Apesar de nunca sabermos 
ao certo se este intervalo é verdadeiro ou falso, podemos estar confiantes 
(95%) de que ele é um bom estimador para (uy). 


TESTE “t ” PARA AMOSTRAS INDEPENDENTES 
(VARIÂNCIAS COMBINADAS) 


Duas amostras independentes ocorrem se as observações em uma 
amostra não estiverem em pares com as observações na outra amostra, 
em uma base de uma para uma. Para aplicarmos este teste trabalhamos 
com os pressupostos de que as amostras são independentes, selecionadas 
de forma aleatória de populações normalmente distribuídas e, ainda, que 


> 


as variâncias da população são iguaus. O teste “t” é robusto, isto é: não 
sensível a distanciamentos moderados da normalidade, desde que o ta- 
manho das amostras sejam grandes. 

Na prática nem sempre é facil verificar a veracidade destas suposi- 
ções. Para facilitar a tomada de decisões é bom construírmos histogra- 
mas ou diagramas de pontos para cada amostra e principalmente calcular 
suas respectivas assimetrias. 

Não importa se estamos testando uma hipótese ou construindo um 
intervalo de confiança. O teste “t” assume que ambas as populações 


subjacentes sejam normalmente distribuídas, com variâncias iguais. Tam- 


Testes de hipóteses envolvendo o estudo dos testes... 


bém não precisamos nos preocupar com violações das condições acima, 
particularmente se ambos os tamanhos de amostras forem iguais e sufi- 
cientemente grande (n 2 15). 

De outra maneira, no evento improvável de se observar divergências 
óbvias da normalidade ou em relação as variâncias dos dados cotrespon- 
dentes a esses dois grupos, considere as seguintes possibilidades: 


1 - Aumentar o tamanho das amostras para minimizar o efeito de qual- 
quer não-normalidade. 

2 - Igualar os tamanhos das amostras para minimizar o efeito de variâncias 
desiguais das populações. 

3 - Utilize um teste menos sensível e mais isento de premissas, como o 
teste “U” de Mann-Whitney. 

4 - Em situações em que partimos do pressuposto de que as duas popula- 
ções normalmente distribuídas não possuem variâncias populacionais 
iguaus pode-se utilizar um teste “t”? de variâncias separadas, desenvolvi- 
do por Satterthwaite. 

5-Oteste “t” é robusto (não sensível) a distanciamentos moderados da 
normalidade, desde que o tamanho das amostras sejam grandes. Para amos- 
tras muito pequenas, podemos utilizar o teste de WILCOXON. 


HIPÓTESES DO TESTE 


H0:ui=u2 e Hi:ui £p2 | HO:pi-p2=0 e Hi:ui-n2%0 
Unilateral direita HO:ul > 42 e Hi:ul<u2 HO: u1-u2 >0 e Hi:ul-u2<0 


Aula 


Unilateral esquerda HO:ui<u2 e Hi:ul>u2 HO: u1-u2S0 e Hi:ul-u2>0 


Exemplo: Durante uma corrida de ciclismo, alguns ciclistas foram 
desclassificados por terem tentado melhorar seus desempenhos por meio 
do “doping do sangue” com um hormônio sintético (eritropoietina ou 
EPO) que estimula a produção das células vermelhas do sangue que car- 
regam oxigênio, inibindo portanto a fadiga. 

Para observar a ação do doping foram analisados dois grupos de vo- 
luntários. O grupo 1 recebe uma quantidade prescrita de EPO, enquanto 
o grupo II recebe uma inofensiva substância neutra. Transcorrido algum 
tempo, cada paciente corre em uma esteira de alta velocidade até a 
exaustão, sendo o tempo de desempenho anotado para cada elemento 
dos grupos. 

Tipos de Hipóteses para duas amostras independentes: No caso 
do doping do sangue a Hipótese nula trabalha com o argumento que o 
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EPO não aumenta a resistência dos atletas (ul - u2)=0, isto é: alguma 
diferença que possa exixtir entre as médias das populações é insignificante. 


Duas propriedades são importantes para esta hipótese: 


1. A sua média aritmética é igual a diferença entre médias aritméticas de 
populações. 


2. O seu erro-padrão mede aproximadamente a quantidade média pela 
qual qualquer diferença entre médias aritméticas de amostras se desvia 
em relação à diferença entre médias aritméticas de populações. 


A Hipótese Alternativa (ou hipótese objeto da pesquisa) trabalha com 
o argumento de que a diferença entre as médias aritméticas das popula- 
ções é positiva em favor do doping do sangue. (ul-uZ) > 0. 


Apesar de não serem apropriadas para este experimento, existem duas 
outras hipóteses alternativas: 


Unicaudal inferior: (ul-u2)<0 e Bicaudal: (ul-u2Z) £0. 


Observação: embora a hipótese bicaudal seja a mais usada, uma hi- 
pótese alternativa direcional (unicaudal) deve ser utilizada quando o ob- 
jetivo da investigação é verificar a ocorrência de diferenças em uma de- 
terminada direção, como ocorre com a pesquisa do doping. 


cc 


Fórmulas pata o teste “t” para amostras independentes 


te =61-2)/1V S(/nl + 1/09) 
Variância Agrupada: S? = (nl -1)sj + (n2-1)s)/(nl + n2-2) 


Variância Agrupada: Ao mutlipicar cada variância da amostra pelos 
respectivos graus de liberdade fica garantido a proporcionalidade na 
variância agupada das variâncias amostrais. Se o tamanho das amostras 
forem diferentes a variância agrupada será mais influênciada pela variância 
da maior amostra. O mesmo acontece se os valores das variâncias 
amostrais forem diferentes. Se o tamanho das amostras forem iguais a 
variância agrupada estará no meio do caminho entre as variâncias amostrais. 


gl = (nl + n2-2) Erro padrão: sx = V(s/nl + s5/n2) 


Intervalo de confiança para ul - u2 (amostras independentes). 
(=1-72) E tc*fsz 


Testes de hipóteses envolvendo o estudo dos testes... Aula 


TESTE “t” PARA AMOSTRAS INDEPENDENTES 
(VARIÂNCIA DIFERENTES) - SATTERTHWAITE 


2 


O teste “t” para a diferença das médias de duas populações com 
variâncias desconhecidas, presumindo que sejam diferentes, deve ser cal- 
culado incluindo as seguintes alterações de cálculo: 


"= (&1-x2) /V (variâncial/nl + variância? /n2) 
Para aproximarmos o teste t? do teste “t” devemos obter o número 


de graus de liberdade pela expressão a seguir. Com em geral “o]” não é 
um número inteiro, este deve ser arredondado. 


gl = (variâncial /nl+ variância2/n2)? / ((variâncial/n1)?/n1 - 1) + 
(variância? /n2)2/n2 - 1) 


EXERCICIO RESOLVIDO 


1. Os registros dos últimos anos de um colégio atestam para os calouros 
admitidos nota média de 115 pontos em uma prova vocacional. Para tes- 
tar a hipótese de que a média de uma nova turma é a mesma das turmas 
anteriores, retirou-se ao acaso, uma amostra de 20 notas, obtendo-se média 
118 e desvio padrão 20. Fazer o teste a um nível de significância de 5% 


HO: u=115 Blu +15 

gl=19 Valor do t crítico = 1,729 

n=20  x=118 s=20 e u=115 

Valor detce=(x - u)/(s/Vn) = 0,67 

Conclusão: Aceita HO (diferença não significativa) 

calculo de “p” 

p=p(t2>tco. Área para: (gl = 19 e te = 0,67= 0,254 
p=p(t20,254) = 0,246 “p” maior do que 0,05 => Aceita HO 

2. Pesquisar se a resistência de cabos de aço é influênciada pelo processo 


de fabricação, conforme dados amostrais abaixo relacionados. Utilizar ní- 
vel de significância de 5%. 
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(HO): A resistência dos cabos de aço são equivalentes ul = u2 


(H1): A resistência dos cabos de aço não são equivalentes ul Zu? 
nl =5; n2 = 7; Variância Combinada (S) 


Ss =(nl-Ds+(n2-Ds)/(nl + n2-2)=4,54 


cc »»> 


Cálculo do valor de “tc” comparando a média entre as duas amostras. 


te = G1-5)/1VS(/nl + 1/n7)) 1,83 


gl = 10 Valor crítico “t” para 5% = +2,228 


10,00 1,65 


12,00 


Conclusão: Os testes de laboratórios não forneceram evidências suficien- 
tes para diferenciar os dois processos de fabricação de cabos de aço. Des- 
te modo aceitamos a hipótese de equivalência entre os mesmos. 


p=2P(ú>to) Áreadetc=0,4490 => p = 10,20% 


Excel  Distt(tc; gl; 1 ou 2) = 0,0969418 = 9,69% => Aceita HO 


Testes de hipóteses envolvendo o estudo dos testes... Aula 


Obs: Para o cálculo de p pelo excel não podemos usar um tc < 0 


3. Repetir exercício considerando amostras com número de elementos 
iguais. (Amostra Be C) 


Dom [o — 


Se =(nl-Ds+(m2-Ds)/(nl + n2-2)=4,45 


Cálculo do valor de “t” comparando a média entre as duas amostras. 
te = /dV Sal + im = 055) 
gl = 12 Valor crítico “t” para 5% = t2,179 


Conclusão: Os testes de laboratórios não forneceram evidências suficien- 
tes para diferenciar os dois processos de fabricação de cabos de aço. Des- 
te modo aceitamos a hipótese de equivalência entre os mesmos. 


4. As amostras abaixo foram retiradas de duas populações independentes 
com variância diferentes. Realizar o teste com significância de 5%. 
Variancias diferentes: usar Satterthwaite 

0,6722 0,0900 

0,0056 0,6400 


Dom [o — 
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HO: Valores médios são equivalentes 
H1: Valores médios não são equivalentes 


gl = (V1/nl + V2/n2)? / ((V1/n1)?/nl - 1) + (V2/n2)?/n2 - 1) = 9 
Valor de “4” tabelado - teste bilateral: = o = 2262 

P = (x1-s3/ 4 (V1/nt + V2/n3 =-1,99 

Conclusão: aceita HO, isto é: a diferença de médias não é significativa 


Para observarmos a diferença de metodologia, vamos aplicar o teste t 
considerando que a variância das populações observadas são iguais. 


Estimativa da Variância geral pela média ponderada das variâncias 
amosttrais. 


Ss = [al = 1)sf + (2-1) s5) /(nl + n2-9)=2,23 
Cálculo do valor de t. comparando a média entre as duas amostras. 


tc=(E1-29)/€V S(/nl + 1/n2))=-1,96 
TESTE “T” PARA AMOSTRAS EMPARELHADAS 


Em processos de inferência para comparar duas amostras supõe-se 
que as amostras sejam extraídas independentemente uma das outras. Essa 
suposição não é valida quando se efetuam mensurações duas vezes so- 
bre os mesmos indivíduos ou em tratamentos alternativos. Os estudos 
comparativos são mais convicentes do que as pesquisas baseadas em 
uma única amostra. Por este motivo, a inferência de amostra única é me- 
nos comum do que a inferência comparativa. Geralmente aplicamos a 
análise comparativa nas seguintes situações: 


. Quando a variável de cada indivíduo é medida antes e depois de uma 
intervenção, como por exemplo: peso antes e depois de um regime. 


. Quando os indivíduos são recrutados aos pares, emparelhados por va- 
riáveis como idade ou diagnóstico: um dos pares recebe uma intervenção, 


enquanto o outro não (ou recebe um tratamento alternativo). 


- Experimentos laboratoriais repetidos. 


Testes de hipóteses envolvendo o estudo dos testes... 


Em um planejamento de dados emparelhados os indivíduos po- 
dem ser selecionados aos pares e cada tratamento é ministrado a um ele- 
mento de cada par, escolhido de forma aleatória. Na formação dos pares 
é importante observarmos as condições de realização do experimento 
para não interferirmos no resultado do teste. O fato de trabalharmos com 
as difernças dentro de cada par, na verdade estamos fazendo a inferência 
sobre uma única população, a população de todas as diferenças dentro de 
pares combinados. 

Não é correto ignorarmos os pares e analisarmos os dados como se 
tivessemos duas amostras. 

No caso particular de uma prova de resistência é fundamental a 
formação de pares em relação ao peso corpóreo dos indivíduos, visto que 
aqueles que estiverem com peso acima do normal, tendem a terem menor 
resistência do que os que estão em melhores condições físicas. Neste caso 
as combinações devem ser iniciadas com os indivíduos com peso mais 
leve e progredindo até os de maior peso. Mesmo assim ainda estamos 
sujeitos a situações particular de cada indivíduo, como: alimentação, víci- 
Os, situação física no momento da prova, etc. 

Outra situação está relacionada com as observações antes e depois 
sobre os mesmos indivíduos, como no caso de um teste de Degustação, 
em que os mesmos degustadores classificam determinado sabor antes e 
depois, isto é: em dois tempos diferentes. 

Para comparar as respostas, ou reações, a dois tratamentos em um 
planejamentos de pares emparelhados, aplicamos o processo “t? de 
uma amostra às diferenças observadas (di). O parâmetro “ yu ” em um 
processo “t? de dados emparelhados é a diferença média entre as amos- 
tras formadas por cada par (Xi e Y1). 

A medida que existe uma dependência entre observações colocadas 
em pares, o erro-padrão para duas amostras relacionadas, devido a me- 
dições repetidas ou a pares combinados de sujeitos, é menor do que o 
erro-padrão para duas amostras independentes. Esta sempre é uma situa- 
ção desejável, visto que um menor erro-padrão se traduz em um teste de 
hipótese que é mais passível de detectar uma falsa hipótese nula. 

Hipóteses do teste para duas amostras emparelhadas: 


Hipótese nula | - HO: ud < O - isto é: não existe diferença 
significativa 
Hipótese alternativa - Hi: ud>0 ou ud<O (unicauda) e 


ud f O (bicaudal) 
A hipótese nula é testada pela pela fórmula: 


tc=d/s/Vn e se ddiede/nd 
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Duas propriedades são importantes para a hipótese nula: 


1. A sua média aritmética é igual a diferença entre médias aritméticas de 
populações. 

2. O seu erro-padrão mede aproximadamente a quantidade média pela 
qual qualquer diferença entre médias aritméticas de amostras se desvia 
em relação à diferença entre médias aritméticas de populações. 


Observação: embora a hipótese bicaudal seja a mais usada, uma hi- 
pótese alternativa direcional (unicaudal) deve ser utilizada quando o ob- 
jetivo da investigação é verificar a ocorrência de diferenças em uma de- 
terminada direção, como ocotre com a pesquisa do doping que veremos a 
seguir: 


Intervalo de Confiança para ud (duas amostras emparelhadas). 


d + t*sdi 


cc 


Aplicação do teste “t” para dados emparelhados. 

Exemplo: Um programa de verão para melhorar o nível dos professo- 
res de línguas no curso do segundo grau, recebeu 20 professores de portu- 
guês para serem avaliados e treinados durante quatro semanas. No come- 
ço do período, os professores foram submetidos a determinado tipo de 
avaliação, sendo a mesma repetida no final do período de treinamento, na 
aula e fora dela. Considere um nível de significância de 5% e verifique se 
houve eficiência no programa de treinamento. 


HO: u = 0 - Não há progresso no treinamento 


Hi: u > 0  - As notas pós-teste em média são superiores as 
do início do treinamento 


Testes de hipóteses envolvendo o estudo dos testes... 


Pro-teste 


4 


—— (di) 


0,6447 
0,0132 


0,0132 
0,0132 


0,0132 
3,8026 


Amostra: n = 20; n-1=19; s = 2,8928 
Cálculo de “tc” com base na amostra 

tc=(d-WD/(s/ vn) = 250/ (28928 /120) = 3,8665 
gl = 19; t (tabelado) = 1,729 
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Conclusão: rejeitamos a hipótese nula, isto é: houve progresso no treina- 
mento. 
6,7) Co 


Calcular: “p” “nível observado de significância” isto é: o menor nível no 
qual a hipótese nula pode ser rejeitada. 


p > 005 =>  Dif não significativa 

p S 005 => Dif. significativa 

p= 2*P( 2 to). Área (tc) = 0,4994 

“p” = 2(0,5 - 0,4994) => “p” = 0,0012 = Rejeita HO 
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Intervalo de confiança para o ganho médio da população de professores 
com nível de confiança de 95% 


d+tt*sd sdi=s/vVn = 0,6469 
L. inferior = 1,38 L. superior = 3,62 


O ganho médio da população está entre 11,38 e 3,623, gerando uma 
margem de erro de 1,12 em relação a média amostral (2,5) para um nível 
de confiança de 95%. Deste modo concluímos que embora 
estatisticamente significante, a frequência ao programa teve efeito bas- 
tante reduzido. 

Questionamentos: Seleção dos professores e normalidade da amostra. 

Poderá haver uma certa tendência de selecionar professores mais de- 
dicados, que estejam dispostos a abrir mão de quatro semanas de suas 
férias, neste caso a seleção não seria aleatória. Essa imprecisão é comum 
quando não extraímos uma amostra aleatória simples da população. 

A amostra também mostra que vários professores obtiveram notas 
pré-teste próximas da nota máxima (36). 

Estes professores não poderiam melhorar muito suas notas, mesmos 
que o domínio de francês aumentasse substancialmente. Este é ponto 
fraco do teste, visto que as diferenças nas notas podem não refletir ade- 
quadamente a eficiência do programa. Esta é uma razão por que o au- 
mento médio foi pequeno. 

Uma última dificuldade com os processos “t” é que os dados acu- 
sam afastamentos da normalidade. Em uma análise de dados emparelha- 
dos, a população das diferenças deve ter uma distribuição normal, visto 
que o teste “t” é aplicado as diferenças. Neste exemplo um dos profes- 
sores perdeu 6 pontos entre o pré-teste e o pós-teste, contribuindo para 
baixar a média de “2,95” dos outros 19 professores para “2,50” de toda 
a amostra (n = 20). Esta distribuição não é normal. 
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Exemplo: os fabricantes de refrigerantes de sabor coca costumam testar 
a perda do sabor doce de novas receitas durante a armazenagem. Para 
acompanhar este processo degustadores classificam o grau do sabor doce 
antes e depois da armazenagem. Às variações de sabor doce, apuradas 
por 10 degustadores para uma nova receita foram as seguintes: 2,0 0,4 
0,7 2,0 -0,4 PR -1,3 1,2 Li 2,3 


HO: Não houve perda de sabor doce Hi: houve perda de sabor doce 


Testes de hipóteses envolvendo o estudo dos testes... 


te =(d-m/(sA/n) e = 02 = 0/0,196/W10)=270 


Nível de Significância = 5%  gl=k-1=9 Valorde t crítico = 1,83 


Conclusão: rejeitamos HO, visto que “tc” cp? 


crítico ao nível de 5%. 


é maior do que o 


Esta decisão de rejeitar “HO” pode ser ratificada com o cálculo do valor 
de de 

O valor “p” para tc = 2,70 é a área a direita de 2,70 sob a curva da 
distribuição “t” com 9 (n-1) graus de liberdade. Não podemos achar o 


6,7) 


valor exato de “p” sem um computador (p = 0,012), mas podemos esti- 


66,7) 


mar com segurança o valor de “p” a partir do critério a seguir: 
p=p(t>tco =p (0,5 - 0,4878) = 0,012 


p: nível observado de significância, isto é: menor nível no qual a hipótese 
nula pode ser rejeitada. 


Ex II: O gerente da oficina de carros afirma que seu procedimento de 
regulagem dos motores consegue reduzir o consumo de combustível sem 
diminuir a potência do motor. Para isso fez uma pesquisa com os donos 
de carro que avaliaram o desempenho do carro antes e depois atribuindo 
uma nota entre 10 |—| 15 - conforme tabela abaixo. 


[= Aralaço | ão Variância 


1,508929 


E DO 


ECO O O 
Dio [um | 4 [om 


EM REA RO RR 


Carro 


E 


[28] 


6») 


| Ó 


Pf=PE 
ER 


t 
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HO: situação antes e depois equivalente 
H1: situação antes e depois não equivalente 


Média dos di = 1,75 

Variância dos di = 5,3571 e Desvio padrão = 2,3146 
Graus de liberdade: gl = n-1=7 => t=2365 

te =(d-m/(8/Vn)=2,139 


Conclusão: regulagem eficiente (Aceita HO) 

Cálculo de “p” => p = 2*(t > tc) = 2*(t > 2,365)= 2*(0,5-0,4631) = 0,074 
Conclusão: aceita HO - valor de “p” maior do que 0,05 => regulagem 
eficiente 


Ex II: Uma amostra de 15 pacientes foram observados em relação ao 
nível de Proteínas totais antes e após um pocesso operatório, conforme 


tabela abaixo. Aplique o teste adequado e conclua se houve no nível de 
Proteínas dos pacientes ao nível de significância de 5%. 
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HO: situação antes e depois equivalente 
H1: situação antes e depois não equivalente 


Média dos di= (0,10) n=15 
Variância dos di = 1,4079; Desvio padrão = 1,1865 
Graus de liberdade - gl = n- 1 = 14 => t(tabelado) = 2,145 


te=(d-m/(s/Vn) = (0,326) 


Conclusão: O nível de proteínas totais não apresentou diferenças signifi- 
cativas entre o pré e o pós-operatório ao nível de significância de 5. 


66,7) 


p” - “nível observado de significância”, isto é: o menor nível no 
qual a hipótese nula pode ser rejeitada. 


p= 2*P( 2tc). p= 2*0,5 - 0,1157) = 0,769 


66,7) 


Conclusão: aceita HO - valor de “p” maior do que 0,05 


DISTRIBUIÇÃO DO QUI-QUADRADO - ESTUDADA 
POR KARL PEARSON 


Se: X1, X2,...,Xn são variáveis aleatórias independentes com distri- 
buição normais de médias: ul, u2,..., un e variâncias: Ol, 02, ...,On, res- 
pectivamente, então a vatiável: x? = D((xi-u)/0)2 = Dz? tem 
distribuição Qui-Quadrado com “gl” graus de liberdade. 


Observe que: X? > 0. 


Principais Parâmetros: Média: Eb?) = u = gl Variância: 
Vx”] = 0? = 2d 


Ex: Considerando uma distribuição Qui-Quadrado com parâmetro 18. 
Encontrar a média, variância, desvio padrão, mediana, primeiro quartil e 
noventa percentil. Considerando um nível de significância de 5% calcular 
o Qui-Quadrado inferior e superior. 


Média: E[x] = u = gl = 18  Variância: V[x] = O? = 20] = 36 
e 0=6 


Q1 = valor da variável que limita área da distribuição com 


significância de 75% e respectivo gl, portanto: QL = 13,7. 


137 


138 


Bioestatística 


C90 = valor da variável que limita área da tabela com significância 
de 10% e respectivo gl, portanto: C90 = 26,0. 
Me = valor da variável que limita área da tabela com significância 


de 50% e respectivo gl, portanto: Me = 17,3 


Qui-quadrado inferior e superior considerando um nível de 
significância de 5%, isto é: um Intervalo de Confiança para entre estes 
limites de 95%. Teremos uma área de 2,5% de significância para cada 
valor do Qui-Quadrado. O Inferior é encontrado a partir de uma área de: 
1-0,025 = 0,975 e gl = 18,e o superior a partir de uma área de 0,025 
e gl= 18, portanto: Qi = 8,23 e Qs = 31,5 


TESTES NÃO-PARAMÉTRICOS 


Os testes não-paramétricos têm grande aplicação em pesquisas da 
área de ciências humanas. Além de serem adaptáveis aos estudos que 
envolvem variáveis com níveis de mensuração nominal e ordinal, bem 
como investigações de pequenas amostras. As provas não-paramétricas 
são tembém denominadas provas livres de distribuição, visto que sua apli- 
cação não exige suposições quanto ao modelo de Distribuição de Proba- 
bilidade da população da qual tenha sido extraída a amostra. 

São bem recomendados para análise de resultados de experimentos 
com dados emparelhados, bem como para tratamento estatístico de da- 
dos oriundos de tabelas de dupla entrada. 


TESTE DO QUI-QUADRADO 


É aplicado principalmente na observação de variáveis que se enqua- 
dram em várias categorias. Por exemplo: Crianças quanto ao modo mais 
frequente de brincar. Grupos de pessoas que sejam a “favor”, 

“contra” ou “indiferentes” a pena de morte. Renda das pessoas e grau de 
Instrução. Local da motadia e grau de Instrução. etc. 


Teste de Entrada Simples: São assim conhecidos por possuirem ape- 
nas uma variável. O grau de liberdade (gl) do teste e dado pelo número 
de eventos da variável pesquisada menos 1: gl = k-1. Na análise do teste 
sempre que rejeitarmos a Hipótese Nula automaticamente aceitamos a 
Hipótese Alternativa. 


Teste para Tabelas de Dupla Entrada ou Teste de Contingência: 
Para este tipo de teste a Hipótese Nula trabalha com o conceito de que as 
varáveis são independentes, isto é: não existe associação entre elas, en- 
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quanto a Hipótese Alternativa vai trabalhar com o oposto desta afirmativa. 


Grau de liberdade do teste: gl = (1-1) *(c- 1); sendo: 1 = nº de 
linhas e c = nº de colunas. 

O teste Qui-Quadrado de associação é aconselhável quando o tama- 
nho da amostra é razoavelmente grande, merecendo maiores cuidados se 
exixtirem frequências esperadas menores do que 5. Neste caso devemos 
juntar classes adjacentes para que possamos um valor de ei > 5. 

Hipóteses do teste: A Hipótese Nula também chamada de Hipóte- 
se de Trabalho (HO) é o objetivo de investigação do teste, sempre esta- 
remos trabalhando a possibilidade de aceitar ou rejeitar esta hipótese. 

A Hipótese Nula será rejeitada quando apresentar um Qui-Quadrado 
calculado maior ou igual ao Qui-Quadrado tabelado, neste caso automa- 
ticamente aceitamos a Hipótese Alternativa. O Qui-Quadrado calculado 
reflete o afastamento entre valores observados e esperados das variáveis 
investigadas. 

Alguns valores do “Qui-quadrado” tabelado ao “Nível de 
Significância” de 5% 


pm of po fim po [om [=[as. 


DEE CE SE MECR EE 
o [| [5 | =o [a [=o [a 


e feps ps E Ep 
Jum jujes [us po [am |o[as 


HENDEnERSREREZRESESA 


Cálculo do valor de “5” => p = Dist.qui( :2)) 
Coeficiente de Contingência: C = raiz (k * pi )/taiz((k - 1) * (n + a ). 
Este coeficiente é indicado para testes de contingência e só faz sentido 
ser calculado quando a Hipótese Nula é rejeitada. 


k > É o menor valor entre linhas e colunas na tabela. (2x2) => k = 2 


O valor “C” sempre estará no intervalo de O a 1 - isto é: 


a col 


Será O quando houver completa independência. Valores próximos a 
O indicam fraca associação. 
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Será 1 quando houver associação perfeita. Valores próximos a 1 
indicam uma forte associação. 


O coeficinte de Contigência é útil, mas não deve ser considerado 
uma medida ideal de associação entre variáveis, visto que existe algumas 
limitações: como por exemplo: Ele atinge o valor zero quando não existe 
associação entre as variáveis, mas não chega a ser igual a 1 quando as 
variáveis são perfeitamente correlacionadas. Para uma tabela 2 x 2 ele é 
igual a 0,707. Tabela 3x3 ele é iguala 0,816. E assim por diante. 
Neste caso ele depende muito do número de “o” da tabela. Também só 
poderemos comparar estes Coeficientes caso provenham de tabelas de 
contingência de mesmo tamanho. Uma outra limitação é que não deve ser 
comparado com qualquer outra medida de correlação como os coeficien- 
tes de Pearson, Kendal, Spearman, etc 
Outra fórmula menos indicada por ser menos completa: 


C = raiz( En) 


CORREÇÃO DE YATES 


Quando o Qui-quadrado for aplicado em tabelas de contingência 
(2 x 2), devemos aplicar a correção de Yates, para as frequências espera- 
das muito pequenas (entre 5 e 10). Ver exemplo a seguir: 


Exemplo: Verificar se há associação entre o hábito de fumar e o gênero 
das pessoas, para 1! = 5%. 


Genero Hábito de Fumar Total 
Sim 


Deco pm pa om— 
Ta [5[5 [0— 


HO: Não há relação entre gênero e hábito de fumar 


H1: Há relação entre gênero e hábito de fumar 
Tamanho da amostra;n = 70 e gd=(c-D*(-1)=1=> Xe= 3,84 
X. = (n(|A*D-B*C| -n/9) /(A+B(C+D) (A+O (B+D) 


BAD = 300; BHO = 250; | APD-BL|- SGA rB=O Ca D=3MKA 
+ C=25;B+ D = 45; Produto = 1E+06; %.= 0,012 
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Conclusão: Aceita HO, isto é: não há associação entre o gênero e o hábito 
de fumar 


p = Distqui(ceog) > p =0,9 (p > 0,05) => Aceita HO 


OUTRA MANEIRA DE FAZER ESTA CORREÇÃO 


Hábito de Fumar 
Reso d Re | Ro y a | ads 1a 


a [5 [Emp [om [Efso| [om fm 


Qui-Quadrado calculado 0,011. A anterior parece ser melhor e mais 
prática 


Ex I: Testar se o número de acidentes em uma rodovia se distribui igual- 
mente pelos dias da semana, conforme dados abaixo. Utilize nível de 
significância de 5%. 


E 
EM 
EH 


HO: O número de acidentes não depende do dia da semana 
H1: O número de acidentes depende do dia da semana 


Nível de significância do teste = 5%; gl=k-1=6 
Qui-Quadrado tabelado = 12,59 
Qui-Quadrado calculado = 17,84 


Conclusão: Para este nível de significância rejeitamos HO. 
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p”? também ratifica esta decisão. 
p= Distqui(Lel) => p= 0,007 (p < 0,05) = Rejeita HO 


Ex II: Testar ao nível de significância de 5% a hipótese de aleatoriedade 
do último algarismo do CI de 40 pessoas conforme dados abaixo 


EO 
4 


: 


HO: A escolha do último algarismo da CI é aleatória 
H1: A escolha do último algarismo da CI não é aleatória 


Nível de significância do teste = 5%; - g=k-1=9 
Qui-Quadrado tabelado = 16,92 
Qui-Quadrado calculado = 2,00 


Conclusão: Para este nível de significância aceitamos HO. 


Cálculo do valor de “p” => Dist.qui( x: eb = 0,991 


66,7) 


Ratificando o cálculo anterior o valor de “p” também leva a aceitação 


de HO. 


Ex. HI: A tabela abaixo apresenta os resultados de um experimento des- 
tinado a investigar o efeito da vacinação de animais contra determinada 
doença. Teste a homogeneidade dos resultados, utilizando um nível de 
significância (+) de 5%. 
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HO: A vacinação não tem efeito em relação a não ocorrência da doença 
Hi: A vacinação tem efeito em relação a não ocorrência da doença 


el=(c-D*(-1) gl= 1, m= 5% 


Qui - Quadrado tabelado = 3,84 
Qui - Quadrado calculado = 1,52 


Conclusão: Para este nível de significância aceitamos HO, situação tam- 


66,7) 


bém confirmado pelo cálculo de “p 
p = Dist.qui( X e) > p=0,22 (p>0,05) => Aceita HO 


Ex. IV: A tabela abaixo apresenta os resultados de uma entrevista realiza- 
da com 300 eleitores em relação à pena de morte e partidos políticos do 
entrevistado. Teste a independência dos resultados, utilizando um nível 
de significância (+) de 5%. 


Opinião a respeito da pena E de cauda Partido de direita 
HE ei)? / do | EE lá ei)? / ei| Total (oi) 
ET morte 


MESES E SECAR 


HO: A opinião sobre a pena de morte não depende do partido político 
H1: A opinião sobre a pena de morte depende do partido político. 


el=(c-D*(1-1) gl=-2; 0= 5% 


Qui - Quadrado tabelado = 5,99 
Qui - Quadrado calculado = 7,22 
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Conclusão: Para este nível de significância rejeitamos HO, situação tam- 


66,7) 


bém confirmado pelo cálculo de “p 
p = Dist.qui( x: e) > p=0,03; (p < 0,05) => Rejeita HO 


Coeficiente de Contingência: 
C = traiz(k* Xe) / traizí(e-D)*(n + Xe) — 0,22 


k (Menor valor entre linhas e colunas na tabela. (3 x 2) k =2 
n (soma total de oi) = 300 


Conclusão: De acordo com o Coeficiente de Contingência, existe uma 
fraca associação entre as variáveis 


Ex.I: A tabela abaixo apresenta resultados de uma entrevista realizada 


com 500 eleitores em relação à pena de morte e partidos políticos do 
entrevistado. Teste a independência dos resultados. Utilize + = 5%. 


HO: A opinião sobre a pena de morte não depende do partido político k 3 
H1: A opinião sobre a pena de morte depende do partido político. 


Nível de Significância = 0,05; d=(-Dfic-)=4 n = 500 
Qui - Quadrado tabelado = 9,49 

Qui - Quadrado calculado = 16,83 

Conclusão: Rejeita HO 


p= Distqui(Xg) => p= 0,002 (p< 0,05) => Rejeita HO 


C = ra (k* Xo) / taiz((k - 1) * (n + x:  & 022 
Regular associação entre as variáveis 
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Ex V: Com o objetivo de verificar se três localidades são diferentes em 
termos de Graus de Instruçãao do chefe da casa, foi selecionada uma 
amostra aleatória de famúlias nestas localidades, conforme tabela a se- 
guir. Teste ao nível de significância de 5% estes dados. 


Localidades 


Instrução Cajueiro Encosta do Morro 


E 


HO: O grau de instrução não depende da localidade k = 3 
H1: O grau de instrução depende da localidade n 


Nível de Significância = 0,05; d=-D*(c-1)=4; Qt=9,49 


Qui - Quadrado calculado = 16,25 
Conclusão: Rejeita HO 


p= Ditqui(L:g) > p=0003 (p< 005) => Rejeita HO 


C=raiz(k*k)/raik-D*(0+X) = 0,42 


Moderada associação entre as variáveis 


ATIVIDADES 


1. As estaturas de 12 recém-nascidos foram tomadas por um Departamen- 
to de Pediatria com os seguintes resultados: 40, 50, 52, 40, 49, 50, 47, 52, 
50, 52, 50, 44. Teste a hipótese de que a média desta proporção é 50 cem 
(use O = 5%). 

2. As condições de mortalidade de uma região são tais que a proporção de 
nascidos que sobrevivem até 60 anos é de 64%. Testar esta hipótese ao 
nível de 5% se em 900 nascimentos amostrados aleatoriamente, verifi- 
cou-se 613 sobreviventes até 60 anos. 
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3. Um comprador de tijolos acredita que a qualidade de tais tijolos esteja 
se deteriorando. Sabe-se, de experiência passada, que a força de esmaga- 
mento desses tijolos é de 400 libras, com desvio padrão de 20 libras. Uma 
amostra de 100 tijolos forneceu uma média de 390 libras. Testar a hipóte- 
se de que a qualidade média não tenha mudado ao nível de 5% de 
significância (zc). 

4. A experiência de muitos anos com um exame de inglês no vestibular 
forneceu a nota média de 64 pontos. Uma amostra de 41 alunos apresen- 
tou média de 68 pontos com desvio padrão de 8 pontos. Pode-se afirmar 
que o resultado no exame de inglês não sofreu alteração para uma 
significância de 5% (tc). 

5. Estão em teste dois métodos potenciais para fechar garrafas. Numa 
sequência de 1.000, a máquina À gera 30 rejeições, enquanto que a má- 
quina B acusa 40 rejeições. Pode-se concluir, ao nível de 5%, de que as 
duas máquinas sejam diferentes? 

6. Em 70 crânios de indivíduos adultos, sendo 40 brancos e 30 negros a 
distância entre o foramem palatino maior e a fossa incisiva apresentou os 
seguintes valores: Brancos: média 40,46 mm e desvio padrão 2,8 mm; 
Negros: média 42,39 mm e desvio padrão 3,2mm. Aplique o teste ade- 
quado, ao nível de significância de 5% e conclua sobre o resultado da 
pesquisa. 

7. O exame do comprimento das barras produzidas por uma siderúrgica 
mostrou uma média de 115 cm, depois de seguidas e intensivas medições. 
Para testar a hipótese de que a média, num certo mês, é a mesma, foi 
selecionada uma amostra aleatória de 20 barras, obtendo-se média 118 
cm e desvio padrão 20 cm. Verificar se é possível aceitar que a média 
continua sendo a mesma, para uma significância de 5%. 

8. Um ensaio de tensões de ruptura de 6 cabos de aço produzidos por uma 
indústria mostrou que a tensão média de ruptura é 7.750 kgf/cm? e que o 
desvio padrão é de 145 kgf/cm?. É possível aceitar a afirmação do fabri- 
cante que diz que a tensão média é de 8.000 kgf/cm?, ao nível de 
significância de 5%. 

9. De uma população À, cujo desvio padrão é 2, extraiu-se uma amostra 
de 31 elementos, cuja média é 15. De outra população B, cujo desvio 
padrão é 3, extraiu-se uma amostra de 33 elementos, cuja média é 14. 
Pode-se afirmar que as populações À e B possuem a mesma média para 
uma significância de 5%. (Calcular zc — variâncias conhecidas). 

10. De uma população A, extraiu-se uma amostra de 13 elementos, cuja 
média é 4,9 e variância 0,8. De outra população B, extraiu-se uma amos- 
tra de 8 elementos, cuja média é 4,5 e variância 0,9. Pode-se afirmar que 
as populações À e B possuem a mesma média para uma significância de 
5%. (Calcular te — variâncias desconhecidas). 
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11. Através do método A, um grupo de 12 estudantes apresentou rendi- 
mento médio de 27, com variância 9. Um segundo grupo com13 estudan- 
tes apresentou rendimento médio de 32, com variância 16. Pode-se afir- 
mar que a média de rendimento do primeiro grupo foi menor para uma 
significância de 5%. 

12. Selecionando 10 trabalhadores para determinar a eficiência de certo 
treinamento para realização de uma tarefa, foi observado os seguintes 
resultados, quanto ao tempo de execução, em minutos: Aplique o teste 
conveniente e conclua obre o resultado do treinamento ao nível de 
significância de 5. 


Trabalhadores: 3 4 5 6 7/8 9/40 
Tempo A. do treinamento: 7 10. di 18 16. 12 12 6 12 


Tempo D. do treinamento: 8 o 2 Ds 7 


13. De acordo com a hereditariedade mendeliana, a geração de certo cruza- 
mento deve ser vermelha, preta, ou branca nas razões 9:3:4. Se um experi- 
mento deu o resultado de: 72 34 e 38 nessas categoria. Podemos afirmar 
que este experimento comprova a teoria acima mencionada? O = 5%. 

14. Num cruzamento de ervilhas, as leis de Mendel indicam que deve- 
mos obter, respectivamente as seguintes proporções: 9/16 ; 3/16; 3/16 
e 1/16. Examinadas 624 ervilhas, as frequências observadas foram: 320 
amarelas lisas, 130 amarelas rugosas, 110 verdes lisas e 64 verdes rugo- 
sas. Testar ao nível de significância de 5% se estas frequências estão de 
acordo com a teoria genética? 

15. Verificar a associação entre estado de nutrição e inteligência, ao 
nível de 5%. 


NUTRIÇÃO ae ALTO SE MÉDIO QL BAIXO | TOTAL 


SAtsiatara 


CEC E OS O 


16. Duas espécies de lubrificantes estão sendo preparadas por um novo 
processo de produção. Cada lubrificante é testado em certo número de 
máquinas e o resultado é depois classificado como aceitável ou inaceitá- 
vel. Testar ao nível de significância de 5% se os dois lubrificantes possu- 
em a mesma eficiência. 
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CLASSIFICAÇÃO LUBRIFICANTE 1 LUBRIFICANTE 2 


17. Foram obtidos os dados abaixo, da classificação de plantas de algodão 
de F,, de acordo com a cor da corola e a forma das folhas. Deseja-se saber 
se as duas classificações são independentes, no nível de 5%. 


Cor da Corola 
Forma da folha 


CONCLUSÃO 


A partir desta aula você deve saber como aplicar testes de hipóteses, 
envolvendo parâmetros observados em uma ou mais amostras, bem como 
o teste do Qui-Quadrado. 

No teste de parâmetros seja uma média ou uma proporção você vai 
sempre comparar o que foi pesquisado em uma amostra com a mesma 
característica na população investigada, procurando avaliar de acordo com 
o nível de significância estabelecido para o teste se a discrepância exis- 
tente entre a característica que foi observada na amostra e a da popula- 
ção é demasiado grande ao ponto de se tornar significativa. 

Para realização desta avaliação você aprendeu que além de estabelecer 
um nível de significância para o teste que no máximo deve ser de 10%, 
sendo 5% e 1% os mais indicados, precisa trabalhar as hipóteses do teste. 
Assim sendo aprendeu que são duas as hipótese. A Hipótese Nula que 
afirma a existência de uma diferença não significativa e a Hipótese Alterna- 
tiva que defende a idéia de uma diferença significativa. Ao realizar o teste 
este vai indicar se você deve aceitar ou rejeitar a Hipótese Nula. 

Todo este desenho de nível de significância e hipótese do teste em 
essência é o mesmo para todos os tipos de teste, inclusive os testes não- 
paramétricos. 

Entre os testes paramétricos você aprendeu como aplicá-los para gran- 
des e pequenas amostras, sejam eles relacionados com a diferença entre 
parâmetros ou entre proporções, bem como para avaliar a diferença entre 
características de duas amostras. Entre eles já sabe quando aplicar o teste 
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normal “z” e o “t” para amostras independentes e para amostras empare- 
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lhadas, além do uso de suas respectivas tabelas de probabilidade. Tam- 
bém aprendeu a realizar Qui-Quadrado envolvendo apenas uma só vatriá- 
vel, bem como a independência entre duas variáveis, de acordo o nível de 
significância estabelecido para o teste e graus de liberdade para cálculo 
da região critica do teste. 

No final da aula temos uma lista de exercícios para serem resolvidos 
em grupos de no máximo cinco pessoas ou individual. Com certeza você 
vai ficar muito satisfeito com os resultados do seu desempenho. 


RESUMO 


Nesta aula apresentamos que quando se investiga uma população por 
intermédio de uma amostra, o principal objetivo é tirar conclusões sobre os 
parâmetros desta população, com uma probabilidade significativa de acerto. 

Um procedimento valioso de avaliação deste tipo de estudo, é o teste 
de hipótese, que procura investigar se os dados da amostra estão coeren- 
tes com os da população, ou se duas ou mais amostras possuem parâmetros 
equivalentes. 

Estes testes podem ser unilaterais ou bilaterais. Os Testes Unilaterais 
são indicados quando se deseja investigar determinada característica da 
população em relação a um único sentido, enquanto os Testes Bilaterais 
são indicados sempre que a divergência crítica é em ambas as direções. 

Definido o tipo de teste vamos à procura do modelo de distribuição 
de probabilidade a ser utilizada na aplicação dos testes de hipóteses. Nes- 
te contexto quando se conhece o desvio padrão da população, a distribui- 
ção adequada é a distribuição normal. Se a população é normal à distri- 
buição amostral será normal para todos os tamanhos da amostra. Se a 
população não é normal este teste será indicado apenas para tamanhos 
de amostras superiores a 30 observações. 

Quando não se conhece o desvio padrão da população, situação que 
ocorre na maioria das vezes, deve-se estimá-lo a partir da amostra. Neste 
caso a distribuição “t” é a indicada. Na prática, entretanto, só se exige o 
uso da distribuição “t” quando o tamanho da amostra é igual ou inferior a 


C6,,77 


30. Para amostras maiores os valores de “t” e “z” são tão aproximados 
que se pode usar a distribuição “z” em lugar da “t”. 

O Qui-Quadrado é um teste não-paramétrico, sendo indicado quan- 
do o tamanho da amostra é razoavelmente grande, merecendo maiores 
cuidados se existirem frequências esperadas menores do que cinco. Pode 
ser dividido em duas categorias: Teste de Entrada Simples: por utilizar 
apenas uma variável. Teste de Contingência: trabalha com duas variáveis 


e investiga a existência de associação ou não entre elas. 
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AUTO-AVALIAÇÃO 


Sou capaz de aplicar o teste normal? 
Sou capaz de aplicar o teste t de Student? 
Sou capaz de aplicar o teste Qui-Quadrado? 


PRÓXIMA AULA 


Correlação linear, Tipos de Correlação. Regressão linear pelo estudo 
da Correlação e utilizando os mínimos quadrados. 
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